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DLACZEGO W DYLEMAT WIEZNIA 
WARTO GRAĆ KWANTOWO?* 


1. Klasyczny dylemat więźnia 


Dylemat Więźnia [DW] jest bardzo znanym przykładem zastosowania teo- 
rii gier do zagadnień związanych z podejmowaniem decyzji. Po raz pierwszy 
opisany przez Flooda i Dreshera [Flood i in. 1952] został spopularyzowany 
przez Alberta Tuckera, którego historii o dwu więźniach dylemat zawdzięcza 
obecną nazwę. Swoja popularność DW zawdzięcza uniwersalności schematu 
gry, która opisuje dylemat decyzyjny powszechnie występujący w wielu sytu- 
acjach życia codziennego. Typowy scenariusz zakłada, że dwaj gracze, Alicja 
i Bartek, niezależnie od siebie wybierają jedną z dwu strategii — „współpraca” 
(W) lub „odmowa” (O). Wybory obu graczy są podstawą do wypłacenia im wy- 
granych, które są opisane w tabeli 1. 


Tabela 1 


Macierz wypłat Dylematu Więźnia 


Bartek 
W O 
|| (w, w) (f, z) 
< (z (k, k) 


Wybór ,,W” oznacza współpracę, a wybór ,,O” jej odmowę. Pierwsza liczba każdej pary to wypłata Alicji, druga to 
wypłata Bartka. Wypłata w to nagroda za współpracę, z to pokusa do zdrady, f to wypłata frajera, a k to kara za 


(obustronną) odmowę współpracy. Liczby te spełniają nierówności: z > w > k > f orazw > af [Straffin 2001]. 


* Praca była dofinansowana ze środków Narodowego Centrum Nauki przyznanych na podstawie 
decyzji nr DEC-2011/01/B/ST6/07197 i DEC-2011/03/B/HS4/03857. 
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Na podstawie macierzy wypłat łatwo zauważyć, że niezależnie od wyboru 
przeciwnika dominującą strategią każdego gracza jest „odmowa”. Para strategii 
(O,O) jest równowagą Nasha (RN) tej gry. Paradoksalnie równowaga ta odpo- 
wiada wygranej (k,k), która jest daleka od rozwiązania optymalnego w sensie 
Pareto, którym jest wynik (w, w). Sposobem uzyskania rozwiązania optymalne- 
go jest obustronna współpraca (W, W). Jednak taka gra wymaga wzajemnego za- 
ufania graczy, gdyż każde odstąpienie od tej strategii daje odmawiającemu na- 
grodę w postaci pokusy do zdrady z, a drugiemu karę w postaci wypłaty frajera 
f. Jeśli gra w DW toczy się pomiędzy osobami, które nie mają do siebie zaufa- 
nia — a taka sytuacja społeczna jest powszechna — to najczęstszym wynikiem gry 
jest obustronna kara za brak współpracy. Gra ma naturalne rozszerzenie do wielo- 
osobowego DW, w którym zasadniczy dylemat pozostaje taki sam, jak w przypadku 
dwuosobowym. Z punktu widzenia praktycznych zastosowań istotnym rozsze- 
rzeniem gry jest jej iterowana wersja [Hamilton i in. 1981], dla której strategie 
graczy zależą od historii wcześniejszych rozgrywek. 


2. Definicja gry kwantowej 


Psychologia eksperymentalna pokazuje, że realne decyzje ludzkie w sytu- 
acji typu DW są często niezgodne z klasyczną RN. Niektórzy badacze dowodzą, 
że lepiej od klasycznych do wyjaśnienia decyzji ludzkich nadają się kwantowe 
metody opisu podejmowania decyzji [Busemeyer i in. 2006; Pothos i in. 2009]. 
Wraz z rozwojem badań na temat kwantowego przetwarzania informacji DW 
doczekał się swej kwantowej wersji [Eisert i in. 1999]. W tym ujęciu strategie 
graczy są operatorami w pewnej przestrzeni wektorowej zwanej sferą Blocha. 
Przestrzeń ta to zbiór kubitów — unormowanych wektorów o współczynnikach 
zespolonych rozpiętych na dwuelementowej bazie {|W}, |O)}, które, z dokładno- 
ścią do fazy, można przedstawić w postaci: 


|p) = cos= |W) + eisin 210), (1) 


gdzie 0 € [0,7] oraz ġ E [—7, 7] (rys. 1). 

Kubity |W) oraz |O) to kwantowe stany czyste reprezentujące ,,wspolpra- 
ce” i „odmowę”. Zgodnie z zasadami mechaniki kwantowej kubit (1) jest super- 
pozycją dwu stanów kwantowych. Oznacza to, że dopóki nie dokonamy pomia- 
ru, nie możemy stwierdzić, w którym z dwu stanów kubit tak naprawdę się 
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znajduje. Jedyne, co możemy powiedzieć, to że pomiar da wynik |W) z prawdo- 
a 8 P ea . 20 
podobieństwem cos? z Oraz wynik |O) z prawdopodobieństwem sin? z: 


| w=() 


10)-(9 


Rys. 1. Sfera Blocha z oznaczonym położeniem kubitów |W) = (5) — „współpraca”, |0} = (9) — „odmowa” 
oraz kubitów leżących w płaszczyźnie x-y i przecinających osie 


W wyniku pomiaru następuje tzw. kolaps funkcji falowej kubitu, która z posta- 
ci (1) przechodzi w stan |W) lub |O). Przykładowo wszystkie kubity na równiku 
sfery Blocha (czerwona linia na rys. 1) reprezentują stan kwantowy, który w wyniku 
pomiaru kolapsuje do stanu |W) lub |O} z prawdopodobieństwem >. Analogiczna 


sytuacja ma miejsce w znanym przykładzie z „kotem Schródingera” — w tym przy- 
padku stany |W) i |0} odnoszą się do „stanu witalności” kota. 

W kwantowej teorii gier to jednak nie kubity |W) ani |O) odpowiadają strate- 
giom graczy. Strategiami są transformacje unitarne O, — dla Alicji oraz (p — dla 
Bartka działające na pewnym, specjalnie przygotowanym i znanym obu graczom, 
splątanym stanie kwantowym |i) ) = JJWW). Transformacje te są w ogólnej po- 
staci obrotami na sferze Blocha Uy € SU(2), określonymi przez macierze unitarne: 


-i 0 ia 0 
R e "cos e'*sin> 
00, p,a) = (2) 
Ys RE 0 i CZE 
—e M sinz el cos > 


gdzie Uy = 0 (0x, py, ax), by E [0, r] oraz ay, by E [-7, Tt], X= A,B. 
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W szczególnym przypadku, gdy obrót jest określony tylko przez kat 0,tj.a=$=0, 
można go wyrazić jako U(8) = 0(6,0,0) = cos W + sinô. Macierz jednost- 
kowa W =U(0) odpowiada strategii „współpraca”, a macierz Ô = U(n) = 


= (> a (zamieniajaca kubity |W) i |O)) odpowiada strategii „odmowa”. Stra- 


tegia U(0) jest równoważna klasycznej strategii mieszanej, dla której prawdopodo- 
bieństwa obu strategii czystych W oraz O wynoszą odpowiednio cos? = i sin? E, 

Gra kwantowa, jako że dotyczy dwojga graczy, toczy się w przestrzeni par 
kubitów, po jednym dla każdego gracza, które są ze sobą skorelowane poprzez 
mechanizm splątania kwantowego (rys. 2). 


Alicja 


Bartek 


Rys. 2. Schemat kwantowego DW 


Gra taka może być fizycznie zrealizowana przez komputer kwantowy reali- 
zujący powyższy algorytm zależny od strategii graczy. Algorytm taki został zre- 
alizowany eksperymentalnie [Du i in. 2002] na dwukubitowym komputerze 
kwantowym opartym na jądrowym rezonansie magnetycznym. Szczegóły jego 
działania, tj. fizyczna implementacja algorytmu kwantowego, nie są istotne dla 
zrozumienia gry kwantowej i w niniejszym artykule zostaną pominięte. 

Stan początkowy gry jest parą kubitów |WW), z których pierwszy jest sta- 
nem Alicji, a drugi stanem Bartka. Wektory bazowe przestrzeni par kubitów: 
IWW}, |WO), |JOW), |OO) są stanami czystymi. Dla wygody rachunkowej 
oznaczymy je jako wektory: (1,0,0,0) (0,1,0,0), (0,0,1,0), (0,0,0,1) czte- 
rowymiarowej przestrzeni stanów. Na stan początkowy |WW) działa operator 
splatający, zdefiniowany w tej przestrzeni jako f = zi + io,Qo,), gdzie 


Oy = (i 3 jest jedną z macierzy Pauliego. W wyniku tego działania otrzymu- 
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jemy f |WW) = 5 |WW) + |OO), czyli stan splątany. Kolejno na uzyskany 
wynik działa iloczyn prosty operatorów 0, ip reprezentujących kwantowe 
strategie Alicji i Bartka. Przed pomiarem stanu końcowego działamy jeszcze opera- 
torem rozplatającym Jt. Stan końcowy |y/4) jest więc ostatecznie dany przez: 


lvk) = J10, © 0s) f WW) (3) 
i jest na ogół stanem splątanym: 


We) = pww WW) + pwo IWO) + pow |OW) + poo 100), (4) 


gdzie |pywl?.... Pool? sa prawdopodobieństwami, że pomiar dokonany w koń- 
cowym stanie mieszanym (4) da jeden z czterech możliwych wyników. 

Wartość oczekiwana wypłaty Alicji $, w grze kwantowej jest średnią wa- 
Żoną czterech klasycznych wartości w, f, z i k z macierzy wypłat (tabela 1): 


$4 = w |Pwwl? +f Ibwol” + z IPowl” + k |Pool?, (5) 


gdzie wagami są kwantowe prawdopodobieństwa odpowiednich stanów czys- 
tych, z dokładnością do fazy równe [Chen i in. 2006]: 


8 84 . Op 

Pww = cos cos? cos(d, + dg) — sin sin 5 B sin(a4 + ap), 

. 04 Og > Op 

Pwo = sin >” cos > Cos(04 — dp) — cos sin" sin(pq — a Ag), 
8 0 0 0 

Pow = sin cos > sin(a, — dp) + cos > Sin" cos($y — ag), 
04 Og ż i 04 x Og 

Poo = cos cos- sin(a + bp) + sin—-sin—-cos(04 + ap). 


Wartość oczekiwaną wypłaty Bartka otrzymamy ze wzoru (5) przez zamianę ro- 
lami f ez. 

Zwróćmy uwagę, że sytuację kwantową można jednak symulować poprzez 
klasyczne obliczanie odpowiednich prawdopodobieństw i podstawienie ich do 
wzoru (5). Uzyskany wynik będzie taki sam, jak średni wynik gry kwantowej 
rozgrywanej wielokrotnie. W przypadku urządzenia kwantowego, które splata 
kubity oraz dokonuje odpowiednich przekształceń unitarnych (3), wynik gry po- 
znamy przez pomiar stanu końcowego (4), który w wyniku kolapsu funkcji fa- 
lowej da jeden z czterech możliwych stanów z właściwym prawdopodobień- 
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stwem. W tym przypadku również można użyć urządzeń klasycznych do loso- 
wania jednego z czterech możliwych stanów czystych |WW), |WO), |OW), 
|OO). Dzięki temu, że gracze wykorzystują strategie kwantowe, splątanie daje 
możliwości wzajemnego oddziaływania na siebie graczy, które nie ma odpo- 
wiednika w grach klasycznych. 


3. Kwantowy DW w granicy klasycznej 


Gra kwantowa przechodzi w grę klasyczną, jeżeli strategie (2) nie zawierają 
zespolonych współczynników fazowych a = @ = 0. Rzeczywiście, operator 
splątujący f jest tak dobrany, aby komutował z iloczynem prostym U,® U5 każ- 
dej pary operatorów klasycznych, ale jij = [, więc IYr) = (U, © Up) IWW) 
i wartość oczekiwana wypłaty Alicji (5) wynosi: 

$,=W cos? eos? + f cos? Asin? 8 + 


-0 8 Bae Si 
+z sin? = cos? =: +k sin? > sin? = (6) 


co daje wynik jak w klasycznej grze, kiedy obaj gracze wybierają strategie mie- 


szane (tabela 2). 


Tabela 2 


Macierz wypłat kwantowego Dylematu Więźnia w granicy klasycznej dy = dy = 0 dla X = A,B, 
gdy gracze grają strategiami mieszanymi wyznaczonymi przez 6, i Og 


Bartek 


W (cos? 2) O (sin? 22) 


W (cos? a) (w, w) (f; z) 


Alicja 


[© (sinż 24) (z, f) (k,k) 


2 


Wypłaty graczy należy pomnożyć przez prawdopodobieństwa wyboru poszczególnych strategii (liczby w nawiasach). 


Jeśli na przykład Alicja wybierze współpracę 04 = 0, a Bartek jej odmówi 
Bg = T, to wynik gry będzie (f,z), czyli wygrana Bartka. Jedyna różnica po- 
między klasycznym DW a granicą klasyczną kwantowego DW polega na tym, 
że w tym pierwszym przypadku gracz wykorzystujący strategię mieszaną sam 
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musi dokonać losowania, a następnie wybrać wylosowaną opcję W lub O. Po- 
między losowaniem a wyborem opcji jest chwila, w czasie której gracz może zmie- 
nić zdanie (i zadany rozkład prawdopodobieństwa) lub przeciwnik może przechwy- 
cić informację o planowanym ruchu (i adekwatnie zareagować). W przypadku 
kwantowym gracz jedynie decyduje się na wybór swojej strategii danej przez kąt 0, 
a całą resztę wykonuje komputer kwantowy. Nie ma możliwości przechwycenia 
informacji kwantowej przez drugą stronę — każda taka próba zakończyłaby się 
kolapsem funkcji falowej i przedwczesnym zakończeniem gry. 

W przypadku klasycznego DW równowagą Nasha jest para strategii (O, O). 
Łatwo to zobaczyć po narysowaniu funkcji wypłat obu graczy w zależności od ką- 
tów 8, 05 € [0,7] (por. rys. 3, gdzie założyliśmy z = 5,w = 3,k = 1i f = 0). 


(W,W) 


3 
(0,0) 


Kąt, gdzie © = 0 odpowiada „współpracy”, a 0 = z „odmowie”. Wypłaty $, i$, są rosnącymi funkcjami 0, i Op, 
a ich wspólne maksimum odpowiada równowadze Nasha (czerwony znacznik) w punkcie (0, O). 


Rys. 3. Wypłaty graczy klasycznego DW parametryzowane kątami 6, 65 € [0, z] 


Punkt 0, = Op = m odpowiadający obustronnej odmowie (O, 0) jest jedyną 
równowagą Nasha klasycznego DW, gdyż obie funkcje wypłat $4(04) i $g (08) 
rosną wraz ze swoimi argumentami, osiągając wspólne maksimum tylko w tym 
jedynym punkcie. 

Jeśli jeden z graczy gra klasycznie, np. (8), to drugi, który wykorzystuje 
kwantowe strategie, może zagrać U (o +1, 0-2). Jak łatwo sprawdzić (5), 


wynik gry będzie w tym przypadku równy (f, Z) na korzyść gracza kwantowego. 
Pokazuje to przewagę strategii kwantowej nad klasyczną — niezależnie od użytej 
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strategii klasycznej gracz kwantowy zawsze znajdzie najlepszą odpowiedź w po- 
staci strategii, która daje mu maksymalną wygraną f, a gracza klasycznego po- 
zostawi z minimalną wypłatą z. Taka sytuację jednak trudno uważać za rozwią- 
zanie gry, gdyż gracz pierwszy, dysponując większą ilością strategii, jest 
uprzywilejowany. 


4. Równowagi Nasha kwantowego DW 


Strategie kwantowe dają jednak dużo większe bogactwo możliwych wyników, 
niemożliwych do osiągnięcia za pomocą strategii klasycznych. Załóżmy, że Alicja 
wybiera dowolną strategię kwantową A = U(@4,¢,,a,). Bartek może wybrać 
strategię Ê = U(85p, Qg, &g) =U (8, + 1, dą, Pa — z). Zauważmy, że niezależ- 
nie od wyboru Alicji, ruch Bartka daje współczynniki (4) pyw = Pow = Poo = 0 
oraz |pyo| = 1. Transformacja użyta przez Bartka „unieważnia” zatem dowolny 
ruch Alicji i doprowadza do sytuacji, że końcową strategią Alicji zapisaną w |g} 
jest „współpraca”, podczas gdy Bartek gra „odmowę”. Wynikiem tej gry jest mak- 
symalna wygrana Bartka ($4 $ B) = (f,z). Jednak gra kwantowa jest symetryczna 
i Alicja moze odpowiedzieć na strategie Bartka Ê strategią 
A = 0(0 DOA) =0 (4, dą — = dA — z). Tym razem jedynym niezero- 
wym współczynnikiem |y%4) jest |powl = 1, czyli teraz Alicja gra „odmowę”, 
podczas gdy Bartek gra „współpracę” i wypłata odwraca się ($ aŚB) = (z,f). Dla 
Bartka najlepszą odpowiedzią na strategię Alicji A’ jest B’ = Ó(6pg,Óap)= 


= 0 (e, +T, dy — z da — r), gdyż wynik gry jest znowu ($4,$s) = (f,Z). 
W końcu najlepszą odpowiedzią na B' jest pierwotna strategia Alicji, która przy- 
wraca jej wygraną ($ aŚB) = (z,f). Załóżmy teraz, że Alicja wybierze strategię 
mieszającą obie swoje strategie cos? aĄ + sin? db ya E [0,7], a Bartek po- 
stąpi podobnie, grając cos? BB + sin? eB "Ye € [0,7]. Wartość oczekiwana 
wygranej Alicji (5) jest równa: 
$,=f (cos? cos? = + sin? f sin? >) + 
+z (cos? YA sin? YB + sin? “4 cos? m), (7) 
2 2 2 2 

Zauważmy, że suma wygranych Alicji i Bartka w tej grze jest stała i wynosi 
$4 +$p =z+f. Na rysunku 4 przedstawiono wypłatę Alicji przy założeniu, 
że: z = 5, w=3,k=1i f = 0, wypłata Bartka jest równa 5 — $4. Gra ma 
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jedną równowagę Nasha dla y} = y, = - w tym punkcie wypłaty graczy są 
$4 = $g = re i żaden z graczy nie powiększy swojej wypłaty przez jedno- 
stronną zmianę swojej strategii [Flitney i in. 2002]. Wystarczy, że jeden z graczy 
zastosuje strategię y = > aby wygrana obu była równa re i niezalezna od stra- 


tegii drugiego (czerwone linie na rys. 4). 


Rys. 4. Wypłata Alicji dla kwantowego DW, w którym przeciwnicy grają strategiami mieszanymi cos? A + 
+ sin? ĝ'i cos? 26 + sin? 2 B”, gdzie ya p € [0,7]. Gra ma jedyną RN w punkcie siodło- 
WYMY, =Vp = = (czerwony znacznik) 


Gra w tej postaci sprowadza się więc do gry o sumie stałej, a jej rozwiąza- 
niem jest punkt siodłowy. Kwantowy DW ma nieskończenie wiele równowag 
Nasha, każdą wyznaczoną przez trójkę pierwotnych strategii Alicji (84, ha, aa). 
Pokazaliśmy zatem, że odpowiedni wybór mieszanych strategii kwantowych 
może zapewnić obu graczom wynik tylko nieco gorszy od wzajemnej współpra- 
cy (pamiętajmy, że w > = z definicji DW). Biorąc jednak pod uwagę, że 
w grze klasycznej jedyną równowagą Nasha jest wynik (k, k), gra kwantowa da- 
je graczom dużo korzystniejszą równowagę — nieosiągalną w grze klasycznej. 

Zauważmy, że jeśli w szczególnym przypadku ustalimy (84, $4, 04) = 
= (0,0,0): 


1-( 30-18-07 {=n w 
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oraz: 

v(i O gee Bye OY HTN WENT" 

A= (5 “== 3 )= idy (9) 
to strategie A, A’, B,B', z dokładnością do stałej, sprowadzają się do czterech 
macierzy (macierz jednostkowa plus trzy macierze Pauliego) z grupy macierzy 
unitarnych SU(2). Macierze Pauliego są generatorami obrotów o kąt Tr wokół 
odpowiednich osi (rys. 1). 


5. Czy można wykorzystać kwantowe równowagi DW? 


Na rysunku 5 przedstawiono diagram użyteczności DW (dla z = 5, w = 3, 
k=1 i f=0) z zaznaczeniem czterech klasycznych strategii 
(W,0), (W,W),(0,W) i (0,0). Seria linii tworzących widzianą pod kątem 
szachownicę odpowiada parom klasycznych strategii graczy (0405) o stałym 
8, (linie czerwone) i stałym 05 (linie niebieskie). Strzałki wskazują preferencje 
graczy i jedyną klasyczną równowagę Nasha w punkcie (0,0). Czarna linia łą- 
cząca punkty (W,0) i (0,W) odpowiada grze o stałej sumie $4 + $g = Z + 
+f=5 i zawiera wszystkie wypłaty kwantowych strategii cos? YA Â+ 


2 
sin? aj Alicji oraz cos” "BB + sin? 8! Bartka. 
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Wypłata Bartka 


Wypłata Alicji 


Niezależnie od strategii mieszanej Alicji (linie czerwone) dla Bartka najkorzystniejszą strategią (strzałki) jest 
O, podobnie w przypadku strategii mieszanych Bartka (linie niebieskie) dla Alicji najkorzystniejszą strategią 


jest O. Kwantowy DW ma równowagę Nasha dla pary strategii G (A+ 4 ), : (B+ B )) korzystniejszą od kla- 
sycznego (0, 0). 


Rys. 5. Diagram użyteczności DW dla z = 5,w = 3,k =1if =0 


Jak wykazalismy w poprzednim rozdziale, jedyna rownowaga Nasha od- 
powiada w tym przypadku parze strategii Ę (A +A ), h (B +B J) Równowaga 
ta daje obu graczom wygraną re = 2,5, korzystniejszq od klasycznej rownowa- 
gi dzięki charakterystycznemu splątaniu klasycznych strategii (W, 0) i (0,W) 
niemożliwemu do uzyskania za pomocą strategii klasycznych. 

Sprowadzenie DW do gry o stałej sumie jest możliwe tylko kwantowo. 
Analiza tego rozwiązania pokazuje, że jego istotą jest specyficzna korelacja 
rozwiązań typu „współpraca” — „odmowa” w taki sposób, aby gracze nie potrafi- 
li przewidzieć, kiedy ich strategia doprowadzi do jednej bądź do drugiej opcji. 
Jeśli Alicja wybiera strategię A, to nie wie, czy Bartek odpowie jej Ê czy B’, tym 
samym nie wie, czy jej ruch jest „współpracą” czy „odmową”. To samo dotyczy 
strategii A’ oraz sytuacji Bartka. Przy takim wyborze strategii kwantowy DW 
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sprowadza się więc do gry o sumie zerowej w wybór strony monety: dwaj gra- 
cze niezależnie od siebie wybierają orła lub reszkę; Alicja wygrywa, jeśli wy- 
brane strony są różne, a Bartek — jeśli są takie same (z ang. „matching pennies”). 
Gra ta jest bardziej znana (w wersji z potrójnym wyborem) jako „papier, nożyce, 
kamień”. Jak wiadomo, nie ma ona rozwiązania w strategiach czystych, a jej je- 
dyną równowagą Nasha jest strategia losowa — wybór dowolnej opcji z jedna- 
kowym prawdopodobieństwem. Jeśli jeden z graczy zastosuje tę strategię, to 
drugi, niezależnie od swojej, nie może podwyższyć wyniku, którego wartość 
oczekiwana wynosi w tym przypadku zero. 

W naturalny sposób pojawia się pytanie, czy kwantowa wersja DW może się 
przyczynić do rozwiązywania typowych sytuacji z życia codziennego, które mają 
charakter dylematu więźnia. Przykłady z innych dziedzin wskazują, że strategie 
kwantowe mogą lepiej niż klasyczne rozwiązywać problemy gier rynkowych i gieł- 
dy [Piotrowski i in. 2002], aukcji i konkursów [Piotrowski i in. 2008] czy hazardu 
[Goldenberg i in. 1999]. Jak wynika z niniejszego artykułu, rozwiązanie dylematu 
za pomocą kwantowych strategii może dać lepsze rezultaty niż klasyczne rozwiąza- 
nia. Klasyczny DW w nieuchronny sposób doprowadza graczy do jedynego racjo- 
nalnego rozwiązania obustronnej odmowy współpracy i w konsekwencji kary za 
brak współpracy, podczas gdy jego kwantowy odpowiednik ma równowagi Nasha 
na dużo korzystniejszym poziomie średniej z „pokusy do zdrady” i „nagrody fraje- 
ra”. Czy zatem strategie kwantowe mogą być praktycznie wykorzystane? 

Jak wiemy, jednym z pozytywnych sposobów, w jaki DW reguluje procesy 
rynkowe, jest równowaga cen, tzw. piękna równowaga Nasha. Dzięki niej firmy, 
które chciałyby sprzedawać swoje towary drożej, de facto obniżają ceny, aby 
optymalizować swoje zyski [Dixit i in. 2009]. Dylemat więźnia polega tu na 
tym, że obopólna (lub wielostronna) współpraca, polegająca na utrzymywaniu 
wysokich cen, jest w sytuacji rynkowej niemal niemożliwa, bo zawsze znajdzie się 
firma, która zechce sprzedawać taniej („odmowa ”), rekompensując sobie niższe ce- 
ny zwiększoną ilością klientów i pozostawiając „na lodzie” (tzn. bez klientów) droz- 
szego producenta („współpraca ). Jednak w niektórych przypadkach działanie me- 
chanizmu DW jest w tej dziedzinie zaburzone, dochodzi do niego w przypadku tzw. 
zmowy cenowej. Znany jest przykład z lat pięćdziesiątych ubiegłego wieku na 
rynku turbin w USA [Dixit i in. 2009]. Trzy firmy umówiły się, że będą stoso- 
wać zawyżone ceny, lecz takie, aby, w zależności od terminu ogłoszenia prze- 
targu, wygrała jedna z nich. Wygrany w danym przetargu brał wszystko (pokusa 
do zdrady), pozostali zostawali z niczym (nagroda frajera). Losowość terminów 
ogłaszania przetargów zapewniała, że wszyscy partnerzy zarabiali, każdy w sto- 
sownym terminie. Najważniejsze w całej sprawie było odpowiednie skorelowa- 
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nie firmy, która miała dany przetarg wygrać, z terminem jego ogłoszenia w taki 
sposób, aby zainteresowani nie mieli wątpliwości, a nikt poza nimi nie był w 
stanie przewidzieć algorytmu (bo zmowy cenowe są nielegalne). Gdyby partne- 
rzy zmowy wykorzystali algorytm oparty na splątaniu kwantowym, żaden ze- 
wnętrzny obserwator nie byłby w stanie udowodnić im zmowy cenowej. Jednak 
dyrektorzy firm wylądowali w więzieniu, gdyż wykorzystali mniej wyszukany, a 
możliwy do odkrycia system korelujący — zwycięzcę przetargu wyłaniano na 
podstawie kalendarza księżycowego — ta czy inna firma wygrywała w zależności 
od ilości dni, które upłynęły od nowiu. 

Pozytywnym przykładem działania, które znajduje analogię do rozwiązania 
kwantowego DW w zagadnieniach ekonomicznych, jest tzw. strategia szachowa 
w negocjacjach [Perrotin i in. 1994]. W strategii tej zakłada się, że niezbędnym 
elementem każdych negocjacji są obustronne ustępstwa, a sztuka negocjowania 
polega na ich umiejętnym doborze. Ustępstwa dotyczące poszczególnych kwe- 
stii (zmiennych) negocjacyjnych są skategoryzowane ze względu na ich ważność 
dla obu stron i naniesione na macierz strategii szachowej, której kolejne wiersze 
oznaczają kwestie: najważniejsze, Średnio ważne i najmniej ważne dla Alicji. 
Kolumny w analogiczny sposób porządkują ważność kwestii dla Bartka. Zmien- 
ne, których ważność dla Alicji jest mniejsza niż dla Bartka, leżą poniżej prze- 
kątnej macierzy strategii, a te, których ważność dla Alicji jest większa niż dla 
Bartka, powyżej przekątnej [Szopa 2010]. Zastosowanie strategii szachowej po- 
lega m.in. na wzajemnej wymianie ustępstw tak, aby Alicja ustępowała w kwe- 
stiach poniżej, a Bartek w kwestiach powyżej przekątnej. Dzięki takiej dystry- 
bucji ustępstw suma ich „ważności” jest minimalizowana, a wynik negocjacji 
zamiast klasycznego „spotkania w połowie drogi” zbliża się do rozwiązania 
optymalnego typu „wygrany-wygrany”. Analogia do równowagi kwantowego 
DW jest następująca: ustępstwa Alicji to jej współpraca”, a Bartka „odmowa, 
w przypadku ustępstw Bartka role się odwracają. Gracze, ustępując sobie kolej- 
no, grają kwantową sekwencją A - B - A- B'-..., gdzie każda kolejna para stra- 
tegii oznacza ustępstwo jednej i wygraną drugiej strony. Sekwencyjna wymiana 
ustępstw nie jest niczym nowym w relacjach społecznych, wynika z głęboko zako- 
rzenionej w naturze ludzkiej korelacji wzajemnych życzliwości, znanej w psycho- 
logii społecznej jako reguła wzajemności [Cialdini 1995]. 


Dlaczego w dylemat więźnia warto grać kwantowo? 187 


Podsumowanie 


Przeprowadzona w niniejszym artykule analiza pokazuje, że do zasymulo- 
wania strategii kwantowych w grach wystarczą klasyczne rachunki. Dzięki zna- 
jomości mechaniki kwantowej jesteśmy w stanie symulować zachowanie się 
cząstek kwantowych i, co za tym idzie, przewidywać wynik stosowania strategii 
kwantowych. Znając wynik działania tych algorytmów, nawet jeśli ich fizycznie 
nie implementujemy, możemy się starać je naśladować, aby wykorzystać szerszą 
klasę możliwych kwantowo rozwiązań gier. W artykule opisaliśmy dwa przykła- 
dy klasycznych procesów — zmowy cenowe oraz strategię szachową, które w du- 
żym stopniu wykorzystują równowagi Nasha kwantowego DW. 

Można zadać pytanie: jaki jest związek gier klasycznych ze zjawiskami 
kwantowymi? Jako teoria matematyczna, gry klasyczne okazują się być szcze- 
gólnym przypadkiem gier kwantowych. Czy realne gry klasyczne, rozgrywane 
codziennie przez ludzi, mają jakiś związek z fizycznymi procesami kwantowy- 
mi? Odpowiedź na to pytanie wydaje się być twierdząca — takim procesem może 
być kolaps funkcji falowej. Według oszacowań [Albrecht i in. 2012] to fluktu- 
acje kwantowe są przyczyną zjawisk makroskopowych, które uznajemy za lo- 
sowe, takich jak np. rzut monetą lub kością. Według cytowanych autorów każde 
praktyczne użycie prawdopodobieństwa ma swoje źródło w zjawiskach kwan- 
towych. Gdyby przyjąć taki punkt widzenia, to każde wykorzystanie w grze stra- 
tegii mieszanej byłoby w istocie zjawiskiem kwantowym. 

W grach kwantowych istotnym elementem mechanizmu gry jest splątanie. 
Czy to zjawisko również ma swój odpowiednik w realnej grze klasycznej? Czy 
obiekty makroskopowe, które są kontrolowane bądź tylko obserwowane przez na- 
sze zmysły, mogą być splątane? Tego nie potrafimy udowodnić. Problemy z deko- 
herencją funkcji falowej powodują, że nawet na poziomie ściśle kontrolowanych 
eksperymentów, odbywających się w skrajnych rygorach odizolowania od oto- 
czenia, trudno jest utrzymać dwa splątane kubity. Budowa komputera kwanto- 
wego, opartego na rejestrze wielu splątanych kubitów, poddanych unitarnym 
operacjom bramek kwantowych, i zdolnego do rozwiązywania za pomocą algo- 
rytmów kwantowych praktycznych problemów lub symulowania gier kwanto- 
wych jest prawdziwym wyzwaniem, które jednak współczesna fizyka nie bez 
sukcesów podejmuje [Vandersypen i in. 2001]. 
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WHY IS IT WORTH PLAYING 
QUANTUM PRISONER'S DILEMMA? 


Summary 


The Prisoner's Dilemma [PD] is the best known example of a two-person, simulta- 
neous game, for which the Nash equilibrium is far from Pareto-optimal solutions. In this 
paper we define a quantum PD, for which player’s strategies are defined as rotations of 
the SU(2) group, parameterized by three angles. Quantum strategies are correlated 
through the mechanism of quantum entanglement and the result of the game is obtained 
by the collapse of the wave function. Classic PD is a particular case of the quantum 
game for which the set of rotations is limited to one dimension. Each quantum strategy 
can be, by appropriate choice of counter-strategy, interpreted as a “cooperation” or “de- 
fection”. Quantum PD has Nash equilibria that are more favorable than the classic PD 
and close to the Pareto optimal solutions. With proper selection of strategies, quantum 
PD can be reduced to the classic, zero-sum, “matching pennies” game. In this paper we 
show examples of economic phenomena (price collusion, the chess strategy) that mimics 
the Nash equilibria of quantum PD. 


